خوشه بندی سبک نگارش دست نوشته برون خط فارسی
thesis
- وزارت علوم، تحقیقات و فناوری - دانشگاه تربیت مدرس - دانشکده مهندسی برق و کامپیوتر
- author فاطمه ولایتی
- adviser احسان اله کبیر
- Number of pages: First 15 pages
- publication year 1390
abstract
هدف این پایان نامه، یافتن و استخراج ویژگی هایی است که بر مبنای آن بتوان دست خط فارسی را خوشه بندی کرد. در این کار، در ابتدا بر روی ویژگی های مبتنی بر بافت، تمرکز شده است. این ویژگی ها شامل دو دسته ویژگی آماری ماتریس باهم آیی و ویژگی مبتنی بر تبدیل گابور است. برای استخراج این ویژگی ها، یک بافت مناسب در ابعاد 1024×1024 مستقل از محتوای سند، از تصویر دستنوشته ایجاد می شود. از ویژگی های دیگری که در این کار از آن ها استفاده شده است، تعدادی ویژگی ساختاری مبتنی بر منحنی پیرامونی است. این ویژگی ها را از هر یک از تصاویر موجود در یک مجموعه داده از 97 دستنوشته فارسی که دارای متون متفاوتی بودند، استخراج کردیم و از الگوریتم k میانگین و شبکه عصبی نگاشت ویژگی خود سامان، برای خوشه بندی این ویژگی ها استفاده شده است. برای ارزیابی این ویژگی ها، یک روش ارزیابی بر مبنای الگوریتم خوشه بندی k میانگین، طراحی کرده ایم. در این الگوریتم از معیار مقایسه باینری ژاکارد استفاده کرده ایم، هم چنین برای محاسبه مراکز خوشه در هر دوره تکرار از الگوریتم k میانگین، از روش انتخاب داده چرخ رولت، بهره گرفته ایم. نتایج بدست آمده، نشان می دهد با ترکیب دو نوع از ویژگی های مبتنی بر منحنی پیرامونی، نرخ خوشه بندی، 75درصد است که نسبت به سایر روش های مورد استفاده در این کار، نرخ بهتری را در برداشته است. کلید واژه: سبک نگارش، خوشه بندی، بافت، فیلتر گابور، ماتریس با هم آیی، منحنی پیرامونی، ژاکارد، چرخ رولت ?
similar resources
تشخیص برون خط کلمات دست نوشته فارسی به کمک بلوک بندی تطبیقی
تشخیص خودکار متن یکی از زیر مجموعه های پردازش تصویر است که به طور گسترده در کتابخانه دیجیتال، خواندن آدرس پستی نامه ها، خواندن چک های بانکی، خواندن فرم ها و پرسشنامه ها استفاده می شود. بازشناسی متون دست نوشته فارسی در دو سطح کلی برون خط و بر خط انجام می پذیرد که سیستم های برون خط خود به دو دسته تقسیم می شود: سیستم های مبتنی بر جداسازی و سیستم های کلی نگر. در سیستم های مبتنی بر جداسازی سعی می ش...
بازشناسی برون خط کلمات دست نوشته فارسی در یک مجموعه ای از لغات
در این پایان نامه بازشناسی برون خط کلمات دست نوشته فارسی در یک فرهنگ لغت محدود مورد مطالعه قرار می گیرد. برای این منظور یک روش دو مرحله ای پیشنهاد می گردد. در مرحله نخست توسط الگوریتم های خوشه بندی سلسله مراتبی وisoclus کلمات موجود در فرهنگ لغت بر اساس تشابه خوشه بندی می شوند. ویژگی های تشابهی به کار رفته در این مرحله، بردارهای پروفایل بالا، پایین، پروژکشن عمودی و تعداد گذر از سیاه به سفید برای...
15 صفحه اولبازشناسی بر خط و بدون محدودیت دست نوشته فارسی
بازشناسی برخط نوشتار یکی از دشوارترین زمینه های شناسایی الگو و هوش مصنوعی بوده و همواره مورد توجه خاص محققان قرار گرفته است. پیچیدگی این زمینه, هنگام برخورد با زبان هایی مثل فارسی و عربی که حروف آن ها باتوجه به موقعیت شان در کلمه, شکل های متفاوتی به خود می گیرند, دوچندان می شود. تحلیل دست نوشته ی فارسی یا عربی در مقایسه با زبان های لاتین، به علت حضور اجزای کوچکی ("نقطه", "دونقطه" و ...) بالا یا...
15 صفحه اولدست نوشته های اسماعیلیان بدخشان
در دور دستها ، پهلو به پهلوی چین ، باریکه سرزمینی است ، بسیار مرتفع ، با کوههای آسمان بوس و به هم فشرده ، با معبرهای تنگ دشوار گذر، با زمستانهای سرد نه ماهه ، برخوردگاه چهار تمدن بزرگ آسیا: ایران، هند، چین و آسیای مرکزی که دورترین نقطه است نسبت به همهی آنها و پناهگاهی است امن برای راندهشدگان از سراسر این سرزمینها ،نه تنها کسان که حتی باورها و اندیشههای کهن ، نه در کنارهم که آمیخ...
full textMy Resources
document type: thesis
وزارت علوم، تحقیقات و فناوری - دانشگاه تربیت مدرس - دانشکده مهندسی برق و کامپیوتر
Keywords
Hosted on Doprax cloud platform doprax.com
copyright © 2015-2023